高性能计算为濒危物种撑起保护伞
在保护和开发濒危物种过程中,研究人员往往会对濒危物种进行基因测序,并利用测序结果,采用生物信息学的方法来比对和分析濒危物种COI基因序列及遗传多样性。
“采用生物信息学的方法来比对和分析濒危物种COI基因序列及遗传多样性”这部分需要更加庞大的算力和数据存储技术支撑。要得到正确的结果,最重要的还是研究人员采用科学严谨的方法来做工作,高性能计算能够加速这一过程。我们以居延海大鳍鼓鳔鳅为例。
居延海位于内蒙古阿拉善盟额济纳旗,曾是西北地区最大的湖泊之一。1992年居延海干涸,大鳍鼓鳔鳅由此消失于此区域。2003年黑河改水工程后居延海又正式蓄水,使得大鳍鼓鳔鳅在居延海重新出现。
课题组对52个标本的COI基因进行序列测定,得到了全部标本的长度为645bp左右的COI基因序列。645bp左右的COI基因PCR扩增产物的测序结果经过校对和拼接后,同源排序得到了52个鱼标本的同源基因序列626bp。
对测定的DNA序列进行人工校正,采用DNA MAN软件进行个体和各鱼群间的序列比对,分析 Cytochrome oxidase subunit I(COI)序列的核苷酸其碱基的组成、位点变异;用MEGAM软件的 Maximum Likelihood方法进行系统进化树、遗传距离和GC含量等分析。利用DANsp v5软件分析基因多态性及单倍型。
这其中的计算任务多,计算总量很大,对存储要求又高,在各个测序分析的阶段还需要借助不同规格的计算资源。面对庞大数据对算力的需求,选择高性能计算(HPC)是目前物种基因研究突破数据算力瓶颈最有效路径。
高性能计算发展至今,之前许多阻碍高性能计算发展和应用的技术上的瓶颈已经被逐渐打破。目前,成本和管理成为阻碍高性能计算普及的最大障碍。
作为高性能计算解决方案的专家,北鲲云从2019年进入中国市场,北鲲云致力于让越来越多的有高算力需求的用户使用上高效、便捷、性价比高的高性能计算服务。
2020年,某港澳大学生物信息课题组需对约2000个物种进行基因组分析,预计需要使用600万核时计算资源,并发约2000核。接入北鲲云超算平台后,在对2000多个物种进行基因组分析的过程中产生约2PB的临时数据及100T以上的最终结果数据,最终耗费约550万核时在预算内完成了整个项目,较租用本校超算中心云资源成本降低了80%。
北鲲云将继续以领先的、性价比高的算力支撑科研机构高效分析日益丰富的基因组数据,增加物种基因数据并行处理能力和速度,为濒危物种撑起保护伞。
扫码申请免费试用
北鲲云一站式云超算平台
立即开启云上高性能计算
如需了解更多详情
可扫码添加“小北”微信号
扫码关注我们
北鲲云
高性能计算解决方案专家